针对选择性搜索算法所需定位窗口数量过多的问题,提出了一种基于视觉显著性和超像素融合的改进方法.首先,利用视觉显著性图像粗略估计物体的位置;然后,从这些初始位置开始,根据图像的表观特征融合相邻超像素,并引入一种背景分析方法以避免过度融合;最后,利用贪心算法将融合后的区域再进行组合,并生成最终的定位窗口.在Pascal VOC 2007数据集上的实验结果表明,与选择性搜索方法相比,在同样的检测标准下(查全率为0.91),改进后的方法所使用的窗口数量减少了20%,而重叠率达到了0.77.该方法由粗到细地进行物体定位,在定位窗口数量较少的情况下仍能保持较高的重叠率和查全率.